Consulta de Guías Docentes



Academic Year/course: 2022/23

625 - Bachelor's Degree in Industrial Processes' Data Engineering

29507 - Probability and Statistics


Syllabus Information

Academic Year:
2022/23
Subject:
29507 - Probability and Statistics
Faculty / School:
175 - Escuela Universitaria Politécnica de La Almunia
Degree:
625 - Bachelor's Degree in Industrial Processes' Data Engineering
ECTS:
6.0
Year:
2
Semester:
First semester
Subject Type:
Basic Education
Module:
---

1. General information

1.1. Aims of the course

In this subjet the student is introduced to the second large block of statistics, statistical inference based on the calculation of probabilities.

Starting from the possibility of occurrence of an event, the concept of probability associated with experiments in which there are some uncertainties about what will happen. This is the starting point for the study of probability, which provides solutions to different problems. Probability Theory is the basis for the study of Statistical Inference, in which mathematical models will be provided to help us know the different random variables from the data of a sample.

The final objective is that the student integrates the basic knowledge that, together with the skills with the tools used in the subject, will be able to make decisions, as well as the elaboration of reports for the professional development as a data engineer.

These approaches and objectives are aligned with the following Sustainable Development Goals (SDGs) of the United Nations Agenda 2030 (https://www.un.org/sustainabledevelopment/es/) so that the acquisition of the learning outcomes of the subject provides training and competence to contribute to some extent to its achievement: Goal 4 Quality education.

1.2. Context and importance of this course in the degree

The subjet is compulsory and is part of the basic training for students of Data Engineering in Industrial Processes. This course is studied in the first semester of the second year of the curriculum, which assumes that the student has already acquired training in the learning outcomes of Fundamentals of Mathematics I and II.

The study of Probability and Statistics provides skills in tools that will be very useful in different assignments in later courses. They could be used for the global understanding and decision making in situations of uncertainty in subjects, such as digital signal processing, quality control and improvement, etc. For all these reasons, this course is a basic tool in the training of a data engineer.

 

1.3. Recommendations to take this course

It is recommended that the student has basic knowledge of differential and integral calculuations. It is also advisable to have some familiarity with  symbolic and numerical calcululations programs.

In order to get the most out of the course, regular attendance to both classes, theoretical and practical, besides participation in them is important. This is how the students will be able to acquire, in a sequential way, the theoretical knowledge and skills with the computer tool used.

 

2. Learning goals

2.1. Competences

Core Competencies:
CB2 - That the students know how to apply their knowledge to their work or vocation in a professional manner and possess the competencies, that are usually demonstrated through the elaboration and defense of arguments and the resolution of problems within their area of study.
CB4 - Students will be able to convey information, ideas, problems and solutions to both, specialized and non-specialized, audiences.
CB5 - That students have developed those learning skills necessary to undertake further studies with a high degree of autonomy further studies with a high degree of autonomy.

General competences:
CG03 - Apply techniques for data acquisition, management and processing in Engineering.
CG06 - Build solutions derived from data analysis that optimize production processes in industry.

Transversal competences:
CT03 - Search, select and responsibly manage information and knowledge.
CT04 - Develop critical thinking and reasoning.
CT05 - Communicate results effectively.
CT07 - Analyze and solve problems autonomously, adapt to unforeseen situations and make decisions.

Specific competences:
CE04 - Solve mathematical problems that may arise in engineering.

2.2. Learning goals

The student, in order to pass this course, must demonstrate the following results....

To know the reflexive use of symbolic and numerical calculation tools.
To master the modeling of engineering environments under stochastic nature by means of random variables, as well as the performance of calculations in situations of uncertainty.
Possess skills of scientific-mathematical thinking, which allow them to ask and answer certain mathematical questions.
Have the ability to handle mathematical language; in particular, symbolic and formal language.

2.3. Importance of learning goals

In the subjet of Probability and Statistics, students will learn and practice statistical support in decision making about a population based on a certain number of sample observations.

Students will develop the skills to work with different data sets, to recognize models on which to rely in order to reach efficient conclusions in the face of uncertainty.

In the professional work of a data engineer, he/she will have to report on a data set in which he/she will need a descriptive study such as the inference techniques that will be covered in this course.

3. Assessment (1st and 2nd call)

3.1. Assessment tasks (description of tasks, marking system and assessment criteria)

Continuous assessment system:

Exams: During the course two main exams will be conducted. They will focus on theoretical and / or practical aspects of the subject:

  • Written test 1: Week 8 will be held and will focus on the subject in the first 8 weeks of the course. Its weight in the final grade will be 30%.
  • Written test 2: Week 15 will be made and will focus on the subject in the second half of the course. Its weight in the final grade will be 30%.

Participatory controls: Throughout the course, students will perform six participatory controls together valued at 20% of the final grade, which consist of conducting practical exercises.

Applied work: Throughout the course, students will perform two works applied to matters of the subject, its valuation is 20% of the final grade.

Overall Assessment: Students who have not passed the subject with the system of continuous assessment, have to pass a global exam whose weight in the final grade will be 80%. Also, they must submit the two applied work required during the course.

Evaluation criteria

In the written tests, controls and work participation will be evaluated: Practical exercises must be properly raised. If a computer program is used in solving exercises, the code used and in any case the results are clearly explained be detailed. The probability distribution assigned to each random variable must be duly justified, identifying the value or values ??of the model parameters. Hypothesis testing will arise clear and defined manner.

4. Methodology, learning tasks, syllabus and resources

4.1. Methodological overview

The proposed methodology seeks to promote student work and continued focus on the more practical aspects of statistics: working with real data.

In order to achieve this goal all practical classes (2 hours per week) will be held in the computer room, using R programming language. The theoretical explanations of the concepts of the subject (2 hours weekly) will be reinforced by examples or case studies analyzed with the computer

The approach, methodology and assessment of this guide are intended to be the same for any teaching scenarios. They will be adapted to the social-health situation at any particular time, as well as to the instructions given by the authorities concerned.

 

4.2. Learning tasks

The course includes the following learning tasks:

The course is organized with 4 hours of class a week for the 15 weeks of the semester. Some of these hours are taught in the computer room, and in them, the teacher explains the more practical aspects of the subject, which are reinforced with practical work by using statistical analysis programs.

Tutored self-employment: 2 hours per week for 15 weeks where the student works autonomously in the computer room in performing work.

Personal work: 60 hours

4.3. Syllabus

The course will address the following topics:

  • Probability: Elements of probability: Event. Probability. Probabilistic space. Conditional probability. Total probability theorem. Bayes theorem. Random variables: Discrete: mass function, distribution function. continuous: density function, distribution function. Expected value: mean, variance. Discrete distributions: Bernoulli trials, binomial, Poisson distribution. Continuous distributions: normal, exponential, uniform distribution, beta, gamma distribution. Multivariate random Variables: probability function, expected value, covariance, independence V.A., distribution chi-square, Student's t, F Snedecor.
  • Introduction to reliability theory: Quality and reliability function, reliability and risk function. Exponential distribution, Weibull distribution.
  • Inference: Parameter estimation: Population and sample. Random, stratified, cluster and systematic sampling. Statistics and Estimator. Simulation. Method of moments, maximum likelihood method. Desirable properties of estimators: bias, efficiency, consistency. Point estimation and interval. Fisher theorem. Central limit theorem. Confidence intervals.
  • Hypothesis testing: null and alternative hypotheses. Error type I and II, significance level, power of contrast. unilateral and bilateral tests. P-value.
  • The goodness of fit: Kolmogorov-Smirnov test. Multivariate linear regression model: Parameter Estimation. stepwise procedures: backward and forward. Akaike index. Residue analysis. 
  • Time series: Components. Combination of components. Trend analysis. Seasonal variations.

4.4. Course planning and calendar

Since the subject consists of 6 ECTS credits, and each consists of 25 hours divided into 10 hours of supervised work and 15 hours of autonomous work, activities of classroom learning (lectures, practical classes and seminars) and activities continuous assessment (participatory controls and written tests) will occupy 60 hours during the semester.

Other classroom activities as personal and tutorials non-contact as the study for the assimilation of concepts and techniques, practice for familiarization with computer tools, problem-solving and test preparation, will require 90 hours of independent student work.

All these activities should add the 150 hours required to achieve learning outcomes pursued the subject. The concrete and comprehensive planning of the course it will be informed to students at the beginning of the course. Also from the beginning of the course, it will be set the dates of the official announcements from the school management. 

4.5. Bibliography and recommended resources

http://psfunizar10.unizar.es/br13/egAsignaturas.php?codigo=29507


Curso Académico: 2022/23

625 - Graduado en Ingeniería de Datos en Procesos Industriales

29507 - Probabilidad y estadística


Información del Plan Docente

Año académico:
2022/23
Asignatura:
29507 - Probabilidad y estadística
Centro académico:
175 - Escuela Universitaria Politécnica de La Almunia
Titulación:
625 - Graduado en Ingeniería de Datos en Procesos Industriales
Créditos:
6.0
Curso:
2
Periodo de impartición:
Primer semestre
Clase de asignatura:
Formación básica
Materia:
Materia básica de grado

1. Información Básica

1.1. Objetivos de la asignatura

En esta asignatura se introduce al alumno en el segundo gran bloque de la estadística, la inferencia estadística apoyada en el cálculo de probabilidades. 

Partiendo de la posibilidad de ocurrencia de un suceso se definirá el concepto de probabilidad asociado a experimentos en los que existe cierta incertidumbre sobre lo que ocurrirá. De aquí partimos en el estudio de la probabilidad, que en si misma proporciona soluciones para diferentes problemas. La Teoría de la Probabilidad es la base para el estudio de la Inferencia Estadística, en la que se proporcionarán modelos matemáticos que nos ayuden a conocer las distintas variables aleatorias partiendo de los datos de una muestra.

El objetivo final es que el alumno integre los conocimientos básicos que junto con la destreza en las herramientas utilizadas en la asignatura sea capaz de tomar decisiones así como la elaboración de informes necesarias para el desarrollo profesional como ingeniero de datos. 

Estos planteamientos y objetivos están alineados con los siguientes Objetivos de Desarrollo Sostenible (ODS) de la Agenda 2030 de Naciones Unidas (https://www.un.org/sustainabledevelopment/es/) de tal manera que la adquisición de los resultados de aprendizaje de la asignatura proporciona capacitación y competencia para contribuir en cierta medida a su logro: Objetivo 4 Educación de calidad.

 

1.2. Contexto y sentido de la asignatura en la titulación

La asignatura es obligatoria y forma parte de la formación básica para los estudiantes de Ingeniería de Datos en Procesos Industriales. Esta asignatura se cursa en el primer semestre del segundo curso del plan de estudios, lo que supone que el estudiante ya ha adquirido formación en los resultado de aprendizaje de Fundamentos de Matemáticas I y II.

El estudio de Probabilidad y Estadística proporciona destrezas en herramientas que serán de gran utilidad en distintas asignaturas de cursos posteriores, para el entendimiento global y la toma de decisiones en situaciones de incertidumbre en asignaturas como procesamiento digital de la señal, control y mejor la calidad, etc. Por todo ello esta asignatura es una herramienta básica en la formación de un ingeniero de datos.

1.3. Recomendaciones para cursar la asignatura

Es recomendable que el estudiante posea conocimientos básicos de cálculo diferencial e integral.  Asimismo es aconsejable
cierta familiaridad con el uso de programas de cálculo simbólico y numérico.
 
Para su mayor aprovechamiento se recomienda la asistencia regular a las clases, tanto teóricas como prácticas y la participación en las mismas. De esta forma el alumnos podrá adquirir de forma secuencial los conocimientos teóricos y destrezas con la herramienta informática utilizada.
 

2. Competencias y resultados de aprendizaje

2.1. Competencias

Al superar la asignatura, el estudiante será más competente para...

Competencias básicas:
CB2 - Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las
competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado
como no especializado.
CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios
posteriores con un alto grado de autonomía.
 
Competencias generales:
CG03 - Aplicar técnicas para la adquisición, gestión y tratamiento de datos en la Ingeniería.
CG06 - Construir soluciones derivadas del análisis de datos que optimicen los procesos de producción en la industria.
 
Competencias transversales:
CT03 - Buscar, seleccionar y gestionar de manera responsable la información y el conocimiento.
CT04 - Desarrollar un pensamiento y un razonamiento crítico.
CT05 - Comunicación de resultados de manera efectiva.
CT07 - Analizar y solucionar problemas de forma autónoma, adaptarse a situaciones imprevistas y tomar decisiones.
 
Competencias específicas:
CE04 - Resolver problemas matemáticos que puedan plantearse en la ingeniería.

2.2. Resultados de aprendizaje

El estudiante, para superar esta asignatura, deberá demostrar los siguientes resultados...

Conocer el uso reflexivo de herramientas de cálculo simbólico y numérico
Dominar el modelado de entornos de la ingeniería bajo naturaleza estocástica mediante variables aleatorias, así como la realización de cálculos en situaciones de incertidumbre.
Poseer habilidades propias del pensamiento científico-matemático, que le permiten preguntar y responder a determinadas cuestiones matemáticas.
Tener destreza para manejar el lenguaje matemático; en particular, el lenguaje simbólico y formal.

2.3. Importancia de los resultados de aprendizaje

En la asignatura de Probabilidad y Estadística se enseñarán y practicarán el apoyo estadístico en la toma de decisiones sobre una población con base en una determianda cantidad de observaciones muestrales. 

Los estudiantes desarrollarán las competencias para trabajar con diferentes conjuntos de datos, reconocer modelos en los que apoyarse para poder llegar a conclusiones eficientes ante una incertidumbre.

En el trabajo profesional de un ingeniero de datos deberá realizar informes sobre un conjunto de datos en el que necesitará de un estudio descriptivo como las técnicas de inferencia que se verán en esta asignatura.

3. Evaluación

3.1. Tipo de pruebas y su valor sobre la nota final y criterios de evaluación para cada prueba

El estudiante deberá demostrar que ha alcanzado los resultados de aprendizaje previstos mediante las siguientes
actividades de evaluacion
Sistema de evaluación continua:
Pruebas escritas: A lo largo del curso se realizarán dos pruebas escritas. Versarán sobre aspectos teóricos y/o
prácticos de la asignatura:
             Prueba escrita 1: Se realizará la semana 8 y versará sobre la materia impartida en las primeras 8 semanas del
             curso. Está relacionada con los resultados de aprendizaje 2, 3 y 4. Su peso en la nota final será de un 30%.
             Prueba escrita 2: Se realizará la semana 15 y versará sobre la materia impartida en la segunda mitad del curso.
             Está relacionada con los resultados de aprendizaje 5 y 6. Su peso en la nota final será de un 30%.
Controles participativos: A lo largo del curso el alumno realizará 6 controles de tipo participativo valorados en
conjunto en un 20% de la nota final, que consistirán en la realización de ejercicios de tipo práctico en el aula de
informática. 
Trabajo aplicado: A lo largo del curso el alumno realizará un trabajo aplicado sobre materias de la asigntura,
su valoración es un 20% de la nota final.
 
Prueba global de evaluación:  Los alumnos que no hayan superado la asignatura con el sistema de calificación continua, deberán realizar en las convocatorias oficiales una prueba escrita de carácter obligatorio equivalente a las pruebas escritas descritas en el punto 1, cuyo peso en la nota final será del 80%. Asímismo, deberá entregar el trabajo aplicado requerido durante el curso.
 
Criterios de Evaluación
En las pruebas escritas, controles de participación y trabajos se evaluará:
Los ejercicios prácticos deberán estar correctamente planteados. Si en la resolución de los ejercicios se usa algún programa informático, se detallará el código utilizado y en todo caso se explicarán claramente los resultados. El modelo de distribución de probabilidades asignado a cada variable aleatoria deberá estar debidamente justificado, identificando el valor o valores de los parámetros del modelo. Los contrastes de hipótesis se plantearán de manera clara y definida.

4. Metodología, actividades de aprendizaje, programa y recursos

4.1. Presentación metodológica general

Se utilizarán diferentes métodos docentes en el proceso de aprendizaje de la asignatura de Probabilidad y Estadística, en función de los objetivos marcados y las competencias desarrolladas:
  • Se emplearán técnicas expositivas para las clases teóricas, con el objetivo de analizar y desarrollar los conceptos fundamentales de la asignatura.
  • Se emplearán formas didácticas de participación, implicando al estudiante, para desarrollar la capacidad de organizar, planificar y tomar decisiones.
  • Se emplearán herramientas informáticas y resolución de casos para abordar las competencias de usar herramientas e instrumentos tecnológicos, resolución de problemas y habilidad para analizar y buscar información de otras fuentes.
  • Se realizarán clases de problemas en pizarra que permitan al estudiante desarrollar la capacidad de adaptación a nuevas situaciones y de aplicar conocimientos en la práctica profesional.
  • Como apoyo se utilizará la plataforma Moodle donde se publicarán los materiales teóricos y prácticos de la asignatura, así como toda la información necesaria para su desarrollo comenzando por la propia guía docente.

 El planteamiento, metodología y evaluación de esta guía está preparado para ser el mismo en cualquier escenario de docencia. Se ajustarán a las condiciones socio-sanitarias de cada momento, así como a las indicaciones dadas por las autoridades competentes.

4.2. Actividades de aprendizaje

El programa que se ofrece al estudiante para ayudarle a lograr los resultados previstos comprende las siguientes actividades...

La asignatura se articula con 4 horas de clase presencial a la semana durante las 15 semanas que dura el semestre.  Algunas de estas horas se imparten en el aula de informática, y en ellas el profesor explica los aspectos más prácticos de la asignatura, que son reforzados con el trabajo práctico mediante el uso de programas de análisis estadístico.

Trabajo autónomo tutorizado: 2 horas semanales durante las 15 semanas donde el alumno trabaja de forma autónoma en el aula de informática en la realización de trabajos.

Trabajo personal: 60 horas

4.3. Programa

  • Probabilidad: Elementos de probabilidad: Suceso. Probabilidad. Espacio probabilístico. Probabilidad 
    condicionada. Teorema de la probabilidad total. Teorema de Bayes. Variables aleatorias: VAD: función de masa,
    función de distribución. VAC: función de densidad, función de distribución. Valor esperado: media, varianza.
    Distribuciones discretas: pruebas de Bernoulli, distribución binomial, distribución de Poisson. Distribuciones
    continuas: distribución uniforme, normal, exponencial, beta, gamma.Variables aleatorias multidimensionales:
    función de probabilidad, valor esperado, covarianza, independencia de v.a., distribución chi-cuadrado, t de Student,
    F de Snedecor.
  • Introducción a la teoría de la fiabilidad: Calidad y fiabilidad, función de fiabilidad y función de riesgo. Distribución exponencial, distribución Weibull.
  • Inferencia: Estimación de parámetros: Población y muestra. Muestreo aleatorio, estratificado, por conglomerados 
    y sistemático. Estadística y Estimador. Simulación. Método de los momentos, método de máxima verosimilitud.
    Propiedades deseables de los estimadores: sesgo, eficiencia, consistencia. Estimación puntual y por intervalos.
    Teorema de Fisher. Teorema central del límite. Intervalos de confianza.
  • Contraste de hipótesis: Hipótesis nula y alternativa. Error tipo I y II, nivel de significación, potencia de contraste. Contrastes unilaterales y bilaterales. P-valor.
  • Contraste de bondad de ajuste: Contraste de Kolmogorov-Smirnov.
  • Regresión lineal multiple: Estimación del modelo. Modelo paso a paso. Indice de Akaike. Análisis de residuos
  • Analisis de la varianza: Anlásis de la varianza de un factor. Tabla ANOVA. Análsis de la varianza bifactorial.
  • Series temporales: Componentes. Combinación de componentes. Análisis de la tendencia. Variaciones estacionales.

4.4. Planificación de las actividades de aprendizaje y calendario de fechas clave

Presentación de la asignatura: En la primera sesión del curso se explican de forma detallada los objetivos y contenidos de la asignatura, se plantea la metodología docente utilizada en las clases y se exponen los criterios de evaluación con nitidez.

Sistema de evaluación continua: Se realizarán dos pruebas intermedias de resolución de problemas utilizando herramientas informáticas. Las pruebas prácticas evaluables serán fijadas en los horarios de sesiones prácticas Estas fechas quedan fijadas al principio de curso por el profesor, y pueden modificarse con previo aviso si el desarrollo del calendario así lo exige.

Convocatoria oficial:  De acuerdo al calendario establecido por el centro, en el periodo de exámenes, el estudiante realizará una prueba global que consistirá en un examen escrito (PE) donde se evaluarán las competencias, así como los dos trabajos. Estas fechas se fijan a principio de curso desde la dirección del centro.

El material que se pondrá a disposición de los alumnos a lo largo del curso, así como las convocatorias de exámenes y los resultados de estas se expondrán en el ADD.

4.5. Bibliografía y recursos recomendados

http://psfunizar10.unizar.es/br13/egAsignaturas.php?codigo=29507